AI032
Программирование массово параллельных процессоров: Практический подход
Расширенное многопоточное выполнение и планирование в CUDA
Цели обучения
- Проанализируйте роль двигателя GigaThread в распределении глобальных блоков между потоковыми мультипроцессорами.
- Оцените влияние планирования групп потоков (warp) и передачи инструкций на загрузку конвейера.
- Оптимизируйте производительность ядра, сбалансировав давление регистров и использование общей памяти по отношению к загрузке.
- Освойте продвинутые примитивы синхронизации и шаблоны выполнения группового взаимодействия.